Ce notebook est une version allégée de Patin_Clement_1_notebook_052023.ipynb pour la création d'une page web avec le package Voilà!.
L'objectif est de partager les résultats de la partie "gestion des valeurs manquantes" du nettoyage, ainsi que de la partie "exploration" d'une manière plus digeste.
Après la partie 1 et les premières étapes du nettoyage :
nous avons traité les valeurs manquantes de notre dataset :
Analyse bivariée - matrice des corrélations :
'nutrition_score_fr_100g ~ pnns_groups_1'¶Postulats :
Hypothèses :
| Nutri_variance | |
|---|---|
| pnns_groups_1 | |
| Beverages | 48.889357 |
| Cereals and potatoes | 45.983866 |
| Composite foods | 34.551479 |
| Fat and sauces | 44.081449 |
| Fish meat eggs | 70.681261 |
| Fruits and vegetables | 21.891621 |
| Milk and dairy products | 48.738368 |
| Salty snacks | 37.122010 |
| Sugary snacks | 43.132819 |
LeveneResult(statistic=461.88072523891805, pvalue=0.0)
| Sum_of_Squares | Degrees_Freedom | Mean_Square | F_statistic | Critical_F | F_test_p_value | Eta_Square | |
|---|---|---|---|---|---|---|---|
| Model | 8.569007e+05 | 8.0 | 107112.583195 | 2457.721728 | 1.938771 | 0.0 | 0.432547 |
| Residual_Error | 1.124156e+06 | 25794.0 | 43.582063 | NaN | NaN | NaN | NaN |
| Total | 1.981056e+06 | 25802.0 | NaN | NaN | NaN | NaN | NaN |
| F1 (32.2%) | F2 (23.1%) | F3 (14.8%) | F4 (12.1%) | F5 (9.1%) | F6 (5.1%) | |
|---|---|---|---|---|---|---|
| carbohydrates_100g | 0.173827 | 0.651534 | 0.035044 | 0.005298 | 0.026228 | 4.472928e-02 |
| fat_100g | 0.697732 | 0.176723 | 0.033686 | 0.000041 | 0.022044 | 1.625139e-02 |
| energy_100g | 0.904021 | 0.004762 | 0.004577 | 0.000092 | 0.005545 | 6.567133e-02 |
| sugars_100g | 0.137462 | 0.596905 | 0.027217 | 0.023230 | 0.019377 | 1.460638e-01 |
| saturated_fat_100g | 0.590833 | 0.139499 | 0.057315 | 0.000028 | 0.012896 | 1.033630e-01 |
| sodium_100g | 0.000980 | 0.043810 | 0.072139 | 0.876743 | 0.006333 | 7.813386e-08 |
| fiber_100g | 0.036086 | 0.030004 | 0.595198 | 0.047092 | 0.275927 | 1.454740e-02 |
| proteins_100g | 0.038912 | 0.207293 | 0.357695 | 0.014949 | 0.361921 | 1.815044e-02 |
brute :
avec un code couleur par catégorie de "pnns_groups_1" :